8/5/5 

DIALOG (R) File 351:Derwent WPI v 
(c) 2001 Derwent Info Ltd. All rts. reserv. 



009565138 

WPI Acc No: 1993-258686/199332 
XRAM ACC No: . C93-114929 
New granulocyte colony stimulating factor fusion proteins - contg. 
stabilising protein, for treating leukopenia, leukaemia, etc. 



Patent Assignee: RHONE POULENC RORER SA (RHON 

(RHON ) 
Inventor: YEH P 

Number of Countries: 022 Number of Patents: 007 
Patent Family: 

Patent No Kind Date Applicat No Kind 

WO 9315211 Al 19930805 WO 93FR86 A 

FR 2686900 Al 19930806 

FI 9403564 A 19940729 



) ; RHONE -POULENC RORER SA 



NO 9402858 



EP 624200 



JP 7503844 



US 5665863 



19940801 



Al 19941117 



19950427 



19970909 



Applicat No 
WO 93FR86 
921065 
93FR86 
943564 
93FR86 
942858 
93904130 
93FR86 
JP 93512987 
WO 93FR86 
WO 93FR86 
US 94256938 



FR 
WO 
FI 
WO 
NO 
EP 
WO 



Date 
19930128 
19920131 
19930128 
19940729 
19930128 
19940801 
19930128 
19930128 
19930128 
19930128 
19930129 
19940727 



Week 
199332 
199344 
199437 

199438 

199444 

199525 

199742 



EP 401384; WO 



Priority Applications (No Type Date) : FR 921065 A 19920131 
Cited Patents: DE 3723781; EP 361991; EP 364980; EP 395918; 

9013653 
Patent Details: 

Patent No Kind Lan Pg Main IPC Filing Notes 
WO 9315211 Al F 36 C12N-015/62 

Designated States (National) : CA FI JP NO US 

Designated States (Regional) : AT BE CH DE DK ES FR GB GR IE IT LU MC NL 
PT SE 

FR 2686900 Al 26 C12P-021/02 

EP 624200 Al F C12N-015/62 Based on patent WO 9315211 

Designated States (Regional) : AT BE CH DE DK ES FR GB GR IE IT LI LU NL 
PT SE 



JP 7503844 
US 5665863 
FI 9403564 
NO 9402858 



W C12N-015/09 

A 32 C12N-015/27 

A C12N-000/00 

A C12N-000/00 



Based on patent WO 9315211 
Based on patent WO 9315211 



Abstract (Basic) : WO 9315211 A 

New recombinant polypeptides (I) comprise an active portion (II) 
coupled to a protein stabilising structure (III), where (II) comprises 
all or part of human granulocyte colony stimulating factor (G-CSF) or i 
G-CSF variant . 

Also claimed are: (1) nucleotide sequences coding for (I); (2) 
expression cassettes contg. such a nucleotide sequence under the 
control of a transcription initiation region and opt. a transcription 
termination region; (3) self -replicating plasmids contg. such 
expression cassettes; and (4) recombinant eukaryotic or prokaryotic 
cells contg. such sequences, cassettes or plasmids. 



USE/ ADVANTAGE - (I) may be used to treat diseases requiring an 
increase in granulocyte count and/or activity, esp. leucopenia and 
certain forms of leukaemia, or to stimulate the immune system during 
transplantat ion (e.g. of bone marrow) or after cancer chemotherapy. (I) 
are capable of maintaining G-CSF activity for long periods in vivo. 
E.g., a specifically disclosed polypeptide (HSA-G-CSF) has lowerf 
activity than native G-CSF in vitro but comparable activity in vivo. 
Dwg .0/8 

Title Terms: NEW; GRANULOCYTE; COLONY; STIMULATING; FACTOR; FUSE; PROTEIN; 

CONTAIN; STABILISED; PROTEIN; TREAT; LEUKOPENIA; LEUKAEMIA 
Derwent Class: B04; D16 

International Patent Class (Main): C12N-000/00; C12N-015/09; C12N-015/27; 

C12N-015/62; C12P-021/02 
International Patent Class (Additional) : A61K-037/02; A61K-038/00; 

C07K-013/00; C07K-014/53; C12N-001/19; C12N-015/14; C12N-015/81; 

C12R-001-645 
File Segment: CPI 




PCT ORGANISATION MONDIALE DE LA PROPRIETE INTELLECTUELLE 

^ Bureau international 

DEMANDE INTERNATIONALE PUBLIEE EN VERTU DU TRAITE DE COOPERATION EN M ATI ERE DE BREVETS (PCI) 



(51) Classification internationale des brevets 5 : 
C12N 15/62, 1/19, A61K 37/02 
C07K 13/00, C12N 15/27, 15/14 
//(C12N1/19, C12R 1:645) 



Al 



(U)Numero de publication internationale: 
(43) Date de publication internationale: 



WO 93/15211 

5 aout 1993 (05.08.93) 



(21) Numero de la demand e internationale : PCT/FR93/00086 

(22) Date de depot international: 28 janvier 1993 (28.01.93) 



(30) Donnees relatives a la priorite: 

92/01065 31 janvier 1992 (31.01.92) FR 



(71) Deposant (pour tous les Etats designes saufUS): RHONE- 

POULENC RORER S.A. [FR/FR]; 20, avenue Ray- 
mond- Aran, F-92160 Antony (FR). 

(72) Inventeur; et 

(75) Inventeur/Deposant (US seulement) : YEH, Patrice [FR/ 
FR]; 11 bis, rue Lacepede, F-75005 Paris (FR). 

(74)Mandataire: BECKER, Philippe; Rhone-Poulenc Rorer 
S.A., Direction Brevets, 20, avenue Raymond-Aron, F- 
92165 Antony Cedex (FR). 



(81) Etats designes: CA, Fl, JP, NO, US, brevet europeen (AT, 
NL PT 'SE^ ° K ' ES> GB> GRl IEl Ut LU ' MQ 



Publiee 

Avec rapport de recherche internationale. 
Avant t expiration du delai prevu pour la modification des 
revendications, sera republiee si de telles modifications sont 
recues. 



(54) Tide: ^ POLYPEPTIDES HAVING GRANULOCYTE COLONY STIMULATING ACTIVITY, PREPARATION 
THEREOF AND PHARMACEUTICAL COMPOSITIONS CONTAINING SAID POLYPEPTIDES 

(54) Hire: NOUVEAUX ^POLYPEPTIDES AYANT UNE ACTTVITE DE STIMULATION DES COLONIES DE GRANU- 
LOCYTES, LEUR PREPARATION ET COMPOSITIONS PHARMACEUTIQUES LES COVENANT 

(57) Abstract 

^SSS^JSXST era " Ul0Cyte ^ StimUlatiD8 PreParati0D therCOf Md P ha ™ a ^cal compo. 

(57)Abrege 

La presente invention conceme de nouveaux polypeptides ayant tme activite de stimulation des colonies de granulocytes 
numains, leur preparation et des compositions pharmaceutiques les contenant 



VMQUEMENTA TITRE D* INFORMATION 

Codes utilises pour identifier les Etais parties au PCT, sur les pages de couverture des brochures 
publiant des demandes Internationales en vertu du PCI*. 



AT 


Aulrichc 


PR 


France 


MR 


Mauri tonic 


AU 


Australia 


GA 


Gohon 


MW 


Malawi 


BB 


BarbaJc 


CB 


Royaumc-Uni 


NL 


Puyvtia* 


BE 


Bclgtquc 


CN 


Guincc 


NO 


Norvcgc 


BP 


Burkina Faio 


CR 


Orucu 


NZ 


Nouvullu-Zclundc 


BC 


Bulgariu 


HU 


Hongriu 


PL 


Polognc 


BJ 


Benin 


IE 


Irfcuulc 


PT 


Portugal 


BR 


Bresil 


IT 


Italic 


RO 


Roumanic 


CA 


Canada 


JP 


Japon 


RU 


Federation du Russic 


CF 


Rcpubliquc (Tcnirafricaim* 


KP 


Rcpubliquc nopulatrc ddmocraiiquc 


SD 


Soudan 


CC 


Congo 




dc Corcc 


SB 


Sucdc 


CH 


Subbc 


KR 


Rcpubliquc dc Corcc 


SK 


Kcpubllquu slovaquc 


a 


Cote d'l voire 


KZ 


Kazakhstan 


SN 


Senegal 


CM 


Camcroun 


LI 


UarhLmstnin 


su 


Union sovictique 


CS 


Tchcca&lovaquk: 


UK 


Sri l.anla 


TO 


Tchad 


C2 


Rcpubliquc icbcquc 


LU 


Luxembourg 


TC 


Togo 


DC 


Allcmagnc 


MC 


Monqco 


UA 


Ukraine 


OK 


Dancmark 


MC 


Madagascar 


US 


Oiau-Unb d'Amcrique 


es 


fespagnc 


ML 


Mali 


VN 


Vtcl Nam 


PI 


(•InlantJi: 


MN 


Mongolic 







WO 93/15211 



PCIYFR93/00086 



1 

NOUVEAUX POLYPEPTIDES AYAN T UNE ACTTVTTR DE STIMULATION 
PES COLONIES DE G RANULOCYTES. 
LEUR PREPARATION ET COMPOSI TIONS PHAR M ACEUTIOUES 

LESCONTENANT 

5 La presente invention concerne de nouveaux polypeptides ayant une activite 

de stimulation des colonies de granulocytes humain, leur preparation et des 
compositions pharmaceutiques les contenant 

La presente invention concerne en particulier des polypeptides chimeres 
composes d'une partie biologiquement active constitute par tout ou partie du G-CSF 
10 ou d'un variant du G-CSF, et d'une structure stabilisatrice essentiellement proteique 
lui conferant de nouvelles proprietes biologiques. 

Le G-CSF humain est un polypeptide secrete de 174 acides amines, ayant 
un poids moleculaire de 18 kD environ. U a 6te isole initialement a partir d'une 
lignSe cellulaire cancereuse (EP 169 566), et son gene a ete clon6, sequence, et 

15 exprime dans differents hotes cellulaires par les techniques du genie genetique (EP 
215 126, EP 220 520). Un ARNm codant potentiellement pour une forme du G-CSF 
ayant 177 acides amines a par ailleurs et6 mis en evidence [Nagata S. et al., EMBO 
J, 5 (1986) 575-581]. Le G-CSF possfcde la capacity de stimuler la differentiation et 
la proliferation de cellules progenitrices de la moelle osseuse en granulocytes. A ce 

20 titre, il possfede la capacite de stimuler les capacites protectrices de Torganisme 
contre Tinfection en favorisant la croissance des polynucleaires neutrophiles et leur 
differentiation aboutissant a la maturity. II est ainsi capable d'activer les fonctions 
prophylactiques de Torganisme, et peut etre utilise dans differentes situations 
pathologiques dans lesquelles le nombre de neutrophiles est anormalement faible, ou 

25 dans lesquelles le systeme immunitaire doit etre renforce, De telles situations 
surviennent par exemple a la suite des traitements de chimiotherapie anticancereuse, 
lors de greffes, et en particulier de greffes de moelle osseuse, ou lors des 
leukopenies. 

L'un des inconvenients du G-CSF actuellement disponible reside dans le 
30 fait qu'il est degrade rapidement par Torganisme une fois administre. Ceci est 
d'autant plus sensible que le G-CSF est generalement utilise & des doses faibles. De 
plus, 1'utilisation de doses plus importantes n*a pu permettre d ! ameliorer les capacites 
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therapeutiques de cette molecule et peut induire des effets secondaires indesirables. 
Ces phenomenes ^elimination et de degradation in vivo constituent done pour 
Tinstant un obstacle a l'exploitation de Tactivite biologique du G-CSF en tant 
qu'agent pharmaceutique. 

5 La presente invention permet de remedier a ces inconvenients. La presente 

invention fournit en effet de nouvelles molecules permettant tine exploitation 
optimale sur le plan therapeutique des proprietes biologiques du G-CSF. La 
demanderesse a en effet mis en evidence que Tactivite optimale du G-CSF se 
manifestait lorsque le G-CSF etait present a faible dose et pendant un temps 

10 prolonge. La demanderesse a maintenant realise des molecules capables de maintenir 
dans l'organisme une activite G-CSF pendant un temps suffisamment long. De plus,, 
la demanderesse a montre qu'il est possible d'exprimer dans des botes cellulaires a 
des niveaux eleves des fusions genetiques generant des chimeres presentant de 
nouvelles proprietes pharmacocinetiques et les proprietes biologiques desirables du 

15 G-CSF. En particulier, les polypeptides hybrides de Hnvention conservent leur 
affinite pour les recepteurs du G-CSF, et sont suffisamment fonctionnels pour 
conduire a la proliferation et a la differentiation cellulaire. Les molecules de 
1'invention possedent par ailleurs une distribution et des proprietes 
pharmacocinetiques particulierement avantageuses dans l'organisme et permettent le 

20 developpement therapeutique de leur activite biologique. 

Un objet de la presente invention concerne done des polypeptides 
recombinants comportant une partie active constitute par tout ou partie du G-CSF, 
ou d'un variant du G-CSF, et une structure stabilisatrice essentiellement proteique. 

Au sens de la presente invention, le terme variant du G-CSF designe toute 
25 molecule obtenue par modification de la sequence comprise entre les residus Thr586 
et Pro759 de la sequence presentee sur la Figure 1, conservant une activit6 G-CSF, 
e'est-a-dire la capacite de stimuler la differentiation des cellules cibles et la 
formation de colonies de granulocytes. Cette sequence corresponds a celle du G-CSF 
mature decrite par Nagata et al. [EMBO J. 5 (1986) 575-581]. Par modification, on 
30 doit entendre toute mutation, substitution, deletion, addition ou modification 
consecutive a une action de nature genetique et/ou chimique. De tels variants 
peuvent etre generes dans des buts differents, tels que notainment celui d'augmenter 
Taffinite de la molecule pour le(s) recepteur(s) du G-CSF, celui d'ameliorer ses 
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niveaux de production, celui d'augmenter sa resistance a des proteases, celui 
d'augmenter son efficacite therapeutique ou de reduire ses effets secondaires, ou 
celui de lui conferer de nouvelles proprietes pharmacocinetiques et/ou biologiques. 

Des polypeptides de Tinvention particulierement avantageux sont ceux dans 
5 lesquels la partie biologiquement active possede : 

(a) la sequence peptidique comprise entre les residus Thr586 et Pro759 de 
la sequence presentee sur la Figure 1, ou, 

(b) une partie de la structure (a), ou, 

(c) une structure derivee des structures (a) ou (b) par modifications 
10 structurales (mutation, substitution addition et/ou deletion d'un ou plusieurs residus) 

et ayant une activite biologique identique ou modifiee. Ce dernier type de 
polypeptides comprend par exemple les molecules dans lesquelles certains sites de 
glycosylation ont ete modifies ou supprimes, ainsi que des molecules dans lesquelles 
un, plusieurs, voire tous les residus cysteine ont ete substitues, II comprend 
15 egalement des molecules obtenues a partir de (a) ou (b) par deletion de regions 
n'intervenant pas ou peu dans l'activite, ou intervenant dans une activite indesirable, 
et des molecules comportant par rapport a (a) ou (b) des residus supplementaires, 
tels que par exemple une methionine N-terminale ou un signal de secretion. 

Plus preferentiellement, les polypeptides chimeres de Tinvention 
20 comprennent une partie active de type (a). 

La partie active des molecules de l'invention peut etre couplee a la structure 
stabilisatrice proteique, soit directement, soit par l'intermediaire d'un peptide de 
jonction. De plus, elle peut constituer Textremite N-terminale comme Textremite C- 
terminale de la molecule. Preferentiellement, dans les molecules de Tinvention, la 
25 partie active constitue la partie C-terminale de la chimfere. 

Comme indique plus haut, la structure stabilisatrice des polypeptides de 
Tinvention est essentiellement proteique, 

Preferentiellement, cette structure est un polypeptide possedant une demie- 
vie plasmatique elevee. A titre d'exemple, il peut s'agir d'une albumine, une 
30 apolipoproteine, une immunoglobuline ou encore une transferrine. II peut §galement 
s'agir "de peptides derives de telles proteines par modifications structurales, ou de 
peptides synthetises artificiellement ou semi-artificiellement, et possedant tine 



WO 93/15211 



PCT/FR93/00086 



4 

demie-vie plasmatique elevee. Par ailleurs, la structure stabilisatrice utilisee est plus 
preferentiellement un polypeptide faiblement ou non-immunogenique pour 
l'organisme dans lequel les polypeptides de 1'invention sont utilises. 

Dans un mode de realisation particulierement avantageux de 1'invention, la 
5 structure stabilisatrice est une albumine ou un variant de l'albumine et par exemple 
la serum-albumine humaine (SAH). II est entendu que les variants de Talbumine 
designent toute proteine a haute demie-vie plasmatique obtenue par modification 
(mutation, deletion et/ou addition) par les techniques du genie genetique d'un gene 
codant pour tin isomorphe donne de la serum-albumine humaine, ainsi que toute 
10 macromolecule a haute demie-vie plasmatique obtenue par modification in vitro de 
la proteine codee par de tels genes* L'albumine etant tres polymorphe, de nombreux 
variants naturels ont deja ete identifies, et plus de 30 types genetiques differents ont 
ete repertories [Weitkamp L.R. et al., Ann. Hum. Genet 22 (1973) 219]. Plus 
preferentiellement, la structure stabilisatrice est une albumine mature. 

15 A titre d'exeraples on peut citer des polypeptides de Tinvention comportant, 

dans le sens N-terminal --> C-tenninal, (i) la sequence de la SAH mature couplee 
directement a la sequence du G-CSF mature (cf. Figure 1), ou (ii) la sequence du G- 
CSF mature couplee par l'intermediaire d'un peptide de liaison a la sequence de la 
SAH mature. 

20 Un autre objet de 1'invention concerne un precede de preparation des 

molecules chimeres decrites ci-avant Plus precisement, ce procede consiste a f aire 
exprimer par un hote cellulaire eucaryote ou procaryote une sequence nucl^otidique 
codant pour le polypeptide desire, puis a recolter le polypeptide produit 

Parmi les hotes eucaryotes utilisables dans le cadre de la presente invention, 

25 on peut citer les cellules animales, les levures, ou les champignons. En particulier, 
s'agissant de levures, on peut citer les levures du genre Saccharomyces. 
Kluweromvces. Pichia. Schwanniomvces. ou Hansenula. S'agissant de cellules 
animales, on peut citer les cellules COS, CHO, C127, etc... Parmi les champignons 
susceptibles d'etre utilises dans la presente invention, on peut citer plus 

30 particulierement Aspergillus ssp. ou Trichoderma ssp. Comme hotes procaryotes, on 
pref ere utiliser les bacteries telles que Escherichia coli. ou appartenant aux genres 
Corvnebacterium. Bacillus, ou Streptomyces . 
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Les sequences nucleotidiques utilisables dans le cadre de la presente 
invention peuvent etre preparees de differentes manieres. Generalement, elles sont 
obtenues en assemblant en phase de lecture les sequences codant pour chacune des 
parties fonctionnelles du polypeptide. Celles-ci peuvent etre isolees par les 

5 techniques de I'hornme de 1'art, et par exernple directement a partir des ARN 
messsagers (ARNm) cellulaires, ou par reclonage a partir d'une banque d'ADN 
complementaire (ADNc) isole a partir de cellules productrices, ou encore il peut 
s'agir de sequences nucleotidiques totalement synthetiques. II est entendu de plus que 
les sequences nucleotidiques peuvent egalement etre ulterieurement modifiees, par 

10 exernple par les techniques du genie genetique, pour obtenir des derives ou des 
variants desdites sequences. 

Plus preferentiellement, dans le proc&Ie de l'invention, la sequence 
nucleotidique fait partie d'une cassette d'expression comprenant une region 
d'initiation de la transcription (region promoteur) permettant, dans les cellules hdtes, 

15 Texpression de la sequence nucleotidique placee sous son controle et codant pour les 
polypeptides de l'invention. Cette region peut provenir de regions promoteurs de 
genes fortement exprimfe dans la cellule hote utilisee, 1'expression etant constitutive 
ou regulable. S'agissant de levures, il peut s'agir du promoteur du gene de la 
phosphoglycerate kinase (PGKL de la glyceraldehyde-3-phosphate deshydrogenase 

20 (GPP) , de la lactase (LAC4 ). des enolases (ENO) . des alcools deshydrogenases 
(ADH). etc... S'agissant de bact6ries, il peut s'agir du promoteur des genes droit ou 
gauche du bacteriophage lambda (PL, PR), ou encore des promoteurs des genes des 
operons tryptophane (Ptrp) ou lactose (Piac)- E° outre, cette region de controle peut 
etre modifiee, par exernple par mutagenese in vitro, par introduction d'elements 

25 additionnels de controle ou de sequences synthetiques, ou par des deletions ou des 
substitutions des elements originels de controle. La cassette d'expression peut 
egalement comprendre une region de terminaison de la transcription fonctionnelle 
dans Thote envisage, positionnee immediatement en aval de la sequence 
nucleotidique codant pour un polypeptide de Tinvention. 

30 Dans un mode prefere, les polypeptides de Tinvention resultent de 

Texpression dans un hote eucaryote ou procaryote d'une sequence nucleotidique et de 
la secretion du produit depression de ladite sequence dans le milieu de culture. II 
est en effet particulierement avantageux de pouvoir obtenir par voie recombinante 
des molecules directement dans le milieu de culture. Dans ce cas, la sequence 
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nucleotidique codant pour un polypeptide de l'invention est precedee d'une sequence 
"leader" (ou sequence signal) dirigeant le polypeptide naissant dans Ies voies de 
secretion de l'hote utilise. Cette sequence "leader" peut etre la sequence signal 
naturelle du G-CSF ou de la structure stabilisatrice dans le cas ou celle-ci est une 
5 proteine naturellement secretee, mais il peut egalement s'agir de toute autre sequence 
"leader" fonctionnelle, ou d'une sequence "leader" artificielle. Le choix de Tune ou 
Tautre de ces sequences est notamment guide par l'hote utilise. Des exemples de 
sequences signal fonctionnelles incluent celles des genes des pheromones sexuelles 
ou des toxines "killer" de levures. 

10 En plus de la cassette d'expression, un ou plusieurs marqueurs permettant 

de selectionner l'hote recombine peuvent etre additionnes, tels que par exemple le 
gene URA3 de la levure S. cerevisiae. ou des genes conferant la resistance a des 
antibiotiques comme la geneticine (G418) ou a tout autre compose toxique comme 
certains ions metalliques. 

15 L'ensemble constitue par la cassette d'expression et par le marqueur de 

selection peut etre introduit directement dans Ies cellules hotes considerees, soit 
insere prealablement dans tin vecteur autoreplicatif fonctionnel. Dans le premier cas, 
des sequences homologues a des regions presentes dans le genome des cellules hotes 
sont preferentiellement additioimees a cet ensemble; lesdites sequences etant alois 

20 positionnees de chaque cote de la cassette d'expression et du gene de selection de 
fagon a augmenter la frequence d'integration de l'ensemble dans le genome de l'hote 
en ciblant l'integration des sequences par recombinaison homologue. Dans le cas ou 
la cassette d'expression est inseree dans un systeme replicatif, un systeme de 
replication pref&t pour les levures du genre Kluyveromyces est derive du plasmide 

25 pKDl initialement isole de K. drosophilarum: un systeme prfef^re de replication pour 
les levures du genre Saccharomvces est derive du plasmide 2\i de S. cerevisiae . De 
plus, ce plasmide d'expression peut contenir tout ou partie desdits systemes de 
replication, ou peut combiner des elements derives du plasmide pKDl aussi bien que 
du plasmide 2\l 

30 En outre, les plasmides d'expression peuvent etre des vecteurs navettes 

entre vn hote bacterien tel que Escherichia coli et la cellule hote choisie* Dans ce 
cas, une origine de replication et un marqueur de selection fonctionnant dans Thote 
bacterien sont requises. II est egalement possible de positionner des sites de 
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restriction entourant les sequences bacteriennes et uniques sur le vecteur 
d'expression: Ceci permet de supprimer ces sequences par coupure et religature in 
vitro du vecteur tronque avant transformation des cellules hotes, ce qui peut re suiter 
en une augmentation du nombre de copies et en une stabilite accrue des plasmides 
5 ^expression dans lesdits hotes. Par exemple, de tels sites de restriction peuvent 
correspondre aux sequences telles que S'-GGCCNNNNNGGCC-S' W) ou 5- 
GCGGCCGC-3* (Not I) dans la mesure ou ces sites sont extremernent rares et 
generalement absents d'un vecteur d'expression. 

Apres construction de tels vecteurs ou cassette d'expression, ceux-ci sont 

10 introduits dans les cellules hotes retenues selon les techniques classiques decrites 
dans la litterature. A cet egard, toute methode permettant d'introduire un ADN 
etranger dans une cellule peut etre utiliste. II peut s'agir notamment de 
transformation, electroporation, conjugaison, ou toute autre technique connue de 
rhomme de Tart, A titre d'exemple pour les hotes de type levure, les differentes 

15 souches de Kluweromvces utilisees ont ete transformees en traitant les cellules 
entieres en presence d'acetate de lithium et de polyethylene glycol, selon la 
technique decrite par Ito et al. [J. Bacteriol. 153 (1983) 163]. La technique de 
transformation decrite par Durrens et al. [Curr. Genet Ifi (1990) 7] utilisanl 
l'ethylene glycol et le dimethylsulfoxyde a egalement ete utilisee. II est aussi 

20 possible de transformer les levures par electroporation, selon la methode decrite par 
Karube et al. [FEBS Letters lfi2 (1985) 90]. Un protocole alternatif est egalement 
decrit en detail dans les exemples qui suivent. 

Apres selection des cellules transformees, les cellules exprimant lesdits 
polypeptides sont inoculees et la recuperation desdits polypeptides peut etre f aite, 

25 soit au cours de la croissance cellulaire pour les proc^dfes H en continu' 1 , soit en fin de 
croissance pour les cultures "en lots" ("batch"). Les polypeptides qui font Tobjet de 
la presente invention sont ensuite purifies a partir du surnageant de culture en vue de 
leur caracterisation moleculaire, pharmacocinetique et biologique. 

Un systeme d*expression prefere des polypeptides de Tinvention consiste en 
* 30 Tutilisation des levures du genre Kluweromvces comme cellule hote, transformees 

par certains vecteurs derives du replicon extrachromosomique pKDl initialement 
isole chez K. marxianus var. drosophilarum . Ces levures, et en particulier K. lactis et 
K. frag ilis sont generalement capables de repliquer lesdits vecteurs de fagon stable et 
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possedent en outre l'avantage d'etre incluses dans la liste des organismes G.R.A.S. 
("(generally Becognized As Safe")- Des levures privilegiees sont preferentiellement 
des souches industrielles du genre Kluyveromvces capables de repliquer de fa$on 
stable lesdits plasmides. derives du plasmide pKDl et dans lesquels a 6te insere un 
5 marqueur de selection ainsi qu'une cassette d'expression permettant la secretion a des 
niveaux eleves des polypeptides de l'invention. 

La presente invention concerne egalement les sequences nucleotidiques 
codant pour les polypeptides chimeres decrits ci-avant, ainsi que les cellules 
recombinantes, eucaryotes ou procaryotes, comprenant de telles sequences. 

10 La presente invention concerne aussi Tapplication a titre de medicament des 

polypeptides selon la presente invention. Plus particulierement, l'invention a pour 
objet toute composition pharmaceutique comprenant un ou plusieurs polypeptides tel 
que decrit ci-avant Plus particulierement, ces compositions peuvent etre utilisees 
dans toutes les situations pathologiques dans lesquelles le nombre et/ou 1'activite des 

15 granulocytes doivent etre stimulees. Notamment, elles peuvent etre utilisees pour la 
prevention ou le traitement des leukopenies ou de certaines leucemies, ou dans le cas 
de greffes ou de traitement anticancereux, pour renforcer ou restaurer le systeme 
immunitaire. 

La presente invention sera plus completement decrite a Taide des exemples 
20 qui suivent, qui doivent etre consideres comme illustratif s et non limitatif s. 

USTE PES FTOTOES 

Les representations des plasmides indiquees dans les Figures suivantes ne sont pas 
tragees a Techelle et seuls les sites de restriction importants pour la comprehension 
des clonages realises ont ete indiques. 

25 Figure 1 : Sequence nucleotidique du fragment de restriction HindT TT 

du plasmide pYG1259 (chimere prepro-SAH-G.CSF). Les fleches noires indiquent 
la fin des regions "pre" et "pro" de la SAH. Les sites de restriction Mst H Apal et 
Sst I (Sac I) sont soulignes. La sequence peptidique du G-CSF est en italique 
(Thr586->Pro759, la numerotation des acides amines correspond a la proteine 

30 chimere mature). 
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Figure 2 : Schematisation des chimeres du type SAH-G.CSF (A), du 
type G.CSF-SAH (B) ou G.CSF-SAH-G.CSF (C). Abreviations utilisees : M/LP, 
methionine initiatrice de la traduction, eventuellement suivie d'une sequence signal 
de secretion; SAH, serum-albumine humaine mature ou un de ses variants; G.CSF, 
5 peptide derive du G-CSF et ayant une activite identique ou modifiee. La fleche noire 
indique Textremite N-terminale de la proteine mature. 

Figure 3 : Carte de restriction du plasmide pYG105 et strategie de 
construction des plasmides ^expression des proteines chimeres de la presente 
invention. Abreviations utilisees: P, promoteur transcriptionnel; T, terminateur 
10 transcriptionnel; IR, sequences repetees inversees- du plasmide pKDl; LPs AH » 
region "prepro" de la SAH; Ap 1 " et Km r designent respectivement les g&ies de 
resistance a Tampicilline (E. coli) et au G418 (levures). 

Figure 4 : Caracterisation du materiel secr6t§ aprfes 4 jours de culture 
(erlenmeyers) de la souche CBS 293.91 transformee par les plasmides pYG1266 
15 (plasmide d'expression tfune chimere du type SAH-G.CSF) et pKan707 (plasmide 
controle). Dans cette experience les resultats des panneaux A, B, et C ont ete migre§ 
sur le meme gel (SDS-PAGE 8 t 5 %) puis traites separemment 

A, coloration au bleu de coomassie; standard de poids moleculaire (piste 2) ; 
surnageant equivalent a 100 ^1 de la culture transformee par les plasmides pKan707 

20 en milieu YPL (piste 1), ou pYG1266 en milieu YPD (piste 3) ou YPL (piste 4), 

B, caracterisation immunologique du materiel secretfe apres utilisation 
tfanticorps primaires diriges contre le G-CSF humain: meme legende qu'en A. 

C, caracterisation immunologique du materiel secrete apres utilisation 
d'anticorps primaires diriges centre Talbumine humaine: meme tegende qu'en A. 

25 Figures : Sequence nucleotidique du fragment de restriction Hindm 

du plasmide pYG1301 (chimere G.CSF-Gly4-SAH). Les fleches noires indiquent la 
fin des regions "pre" et "pro" de la SAH. Les sites de restriction Apal Sst I (Sac I) et 
MstH sont soulignes. Les domaines G.CSF (174 residus) et SAH (585 residus) sont 
separes par le linker synthetique GGGG. La numerotation des acides amines 

30 corresponds a la proteine chimere G.CSF-Gly4-SAH mature (763 residus). La 
sequence nucleotidique comprise entre le codon de terminaison de la traduction et le 
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site Hindi n provient de l'ADN complementaire (cDNA) de la SAH tel que decrit 
dans la demande de brevet EP 361 991. 

Figure 6 : Caracterisation du materiel secrete apres 4 jours de culture 
(erlenmeyers en milieu YPD) de la souche CBS 293.91 transformee par les 
5 plasmides pYG1267 (chimere SAH-G.CSF) , pYG1303 (chimere G.CSF-Gly4-SAH) 
et pYG1352 (chimere SAH-Gly4-G.CSF) apres migration sur gel SDS-PAGE 
8,5 %. 

A, coloration au bleu de coomassie; sumageant equivalent a 100 yl de la 
culture transformee par les plasmides pYG1303 (piste 1), pYG1267 (piste 2) ou 

10 pYG1352 (piste 3); standard de poids moleculaire (piste 4). 

B, caracterisation immunologique du materiel secrete apres utilisation 
d'anticorps primaires diriges contre le G-CSF humain : meme legende qu'en A. 

Figure 7 : Activite sur la proliferation cellulaire in vitro de la Iignee 
murine NFS60. La radioactivite (^H-thymidine) incorporee dans les noyaux 
15 cellulaires apres 6 heures d'incubation est representee en ordonnee (cpm) ; la 
quantite de produit indiquee en abscisse est exprimee en molarite (unites arbitraires). 

Figure 8 : Activite sur la granulopoiese in vivo chez le rat Le nombre de 
neutrophiles (moyenne de 7 animaux) est indiquee en ordonnee en fonction du 
temps. Les produits testes sont la chimere SAH-G.CSF (pYG1266, 4 ou 40 
20 mg/rat^our), le G-CSF reference (10 mg/rat/jour), la SAH recombinante purifiee a 
partir de sumageant de Kluyveromyces lactis (rHSA, 30 mg/rat/jour, cf. EP 
361 991), ou du serum physiologique, 

TECHNIQUES GENERALES DE CLONAGE 

25 Les methodes classiquement utilisees en biologie moleculaire telles que les 

extractions preparatives d'ADN plasmidique, la certtrifugation d*ADN plasmidique 
en gradient de chlorure de cesium, Telectrophorese sur gels d'agarose ou 
rfacrylamide, la purification de fragments d'ADN par electrocution, les extraction 
de proteines au phenol ou au phenol-chloroforme f la precipitation d'ADN en milieu 

30 salin par de Tethanol ou de Tisopropanol, la transformation dans Escherichia coli 
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etc... sont bien connues de I'homme de metier et sont abondament decrites dans la 
litterature [Maniatis T. et al., "Molecular Cloning, a Laboratory Manual" , Cold 
Spring Harbor Laboratory, Cold Spring Harbor, N.Y., 1982 ; Ausubel F.M. et al. 
(eds), "Current Protocols in Molecular Biology", John Wiley & Sons, New York, 
5 1987], 

Les enzymes de restriction ont ete foumies par New England Biolabs 
(Biolabs), Bethesda Research Laboratories (BRL) ou Amersham et sont utilis6es 
selon les recommandations des foumisseurs. 

Les plasmides de type pBR322, pUC et les phages de la serie M13 sont 
10 d'origine commerciale (Bethesda Research Laboratories). 

Pour les ligatures, les fragments d'ADN sont separes selon leur taille par 
electrophorese en gels d' agarose ou d'acrylamide, extraits au phenol ou par un 
melange phenol/chloroforme, precipites a Tethanol puis incubes en presence de 
T ADN ligase du phage T4 (Biolabs) selon les recommandations du f ournisseur. 
15 Le remplissage des extremites 5' proeminentes est effectue par le fragment de 

Klenow de l'ADN Polymerase I d' Rcoli (Biolabs) selon les specifications du 
fournisseur. La destruction des extremites 3* proeminentes est effectuee en presence 
de l'ADN Polymerase du phage T4 (Biolabs) utilisee selon les recommandations du 
fabricant. La destruction des extremites 5 1 proeminentes est effectuee par un 
20 traitement menage par la nuclease SI. 

La mutagenese dirigee in vitro par oligodeoxynucleotides synthetiques est 
effectuee selon la methode developpee par Taylor et al. [Nucleic Acids Res. 13 
(1985) 8749-8764] en utilisant le kit distribue par Amersham. 

L'amplification enzymatique de fragments d'ADN par la technique dite de 
25 PCR [Eolymerase-catalyzed £hain Reaction, Saiki R.K. et al., Science 22fi (1985) 
1350-1354; Mullis K.B. et Faloona F.A., Meth. Enzym. 155 (1987) 335-350] est 
effectuee en utilisant un "DNA thermal cycler" (Perkin Elmer Cetus) selon les 
specifications du fabricant 

La verification des sequences nucleotidiques est effectuee par la methode 
30 developpee par Sanger et al. [Proc. Natl. Acad. Sci. USA, 24 (1977) 5463-5467] en 
utilisant le kit distribue par Amersham. 

Les transformations de K. lactis avec TADN des plasmides d'expression des 
proteines de la presente invention sont effectuees par toute technique connue de 
I'homme de Tart, et dont un exemple est donne dans le texte. 
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Sauf indication contraire, les souches bacteriennes utilisees sont E. coli 
MC1060 QacIPOZYA, X74, galU, galK, strA r ), ou E. coli TGI pmA,B, SUgE, 
ILL h5dD5 / FlcaD36, beqA+B* lacfl, lacZ, M15). 

Les souches de levures utilisees appartiennent aux levures bourgeonnantes et 
5 plus particulierement aux levures du genre Kluweromvces. Les souche K. lactis 
MW98-8C (a, mA* a£g. l3S» K + , pKDl°) et K. lactis CBS 293.91 ont ete 
particulierement utilisees ; un echantillon de la souche MW98-8C a ete depose le 
16Septembre 1988 au Centraalbureau voor Schimmelkulturen (CBS) a Baarn 
(Pays-Bas) ou il a ete enregistre sous le numero CBS 579.88. 
10 Les souches de levures transformees par les plasmides d'expression codant 

pour les proteines de la presente invention sont cultivees en erlenmeyers ou en 
fermenteurs pilotes de 21 (SETRIC, France) a 28°C en milieu riche (YPD ; 1 % 
yeast extract, 2 % Bactopeptone, 2 % glucose ; ou YPL : 1 % yeast extract, 2 % 
Bactopeptone, 2 % lactose) sous agitation constante. 

15 EXEMPLE 1 : CONSTRUCTION D'UN FRAGMENT DE RESTRICTION 
MST II /HIND III INCLUANT LA P ARTIE MATURE DU G-CSF HUMAIN 

Un fragment de restriction MstH-Hindin incluant la forme mature du G-CSF 
humain est genere, par exemple selon la strategic suivante : un fragment de 
restriction Kpnl-Hindm est tfabord obtenu par la technique tfamplification 

20 enzymatique PGR en utilisant les oligodeoxynucl&rtides Sq2291 (5'- 
CAAGGATC CAAGCTTC AGGGCTGCGCAAGGTGGCGTAG-3 1 . le site HinjUn 
est souligne) et Sq2292 (S-CG GGGTACC ITAGGCITAACCCCCCrG- 
GGCCCTGCCAGC-3 , f le site Kpnl est souligne) comme amorce sur le plasmide 
BBG13 servant comme matrice. Le plasmide BBG13 comporte le gene codant pour 

25 la forme B (174 acides amines) du G-CSF mature humain, obtenu auprfes de British 
Bio-technology Limited, Oxford, England. Le produit tfamplification enzymatique 
d'environ 550 nucleotides est ensuite digere par les enzymes de restriction Kpnl et 
Hindi n et clone dans le vecteur pUC19 coupe par les memes enzymes, ce qui genere 
le plasmide recombinant pYG1255. Ce plasmide est la source tfun fragment de 

30 restriction Mstll -Hindi n. dont la sequence est incluse dans celle de la Figure 1. Un 
fragment de restriction Mstll -Hindi n codant pour la meme sequence polypeptidique 
peut egalement etre genere par la technique tfamplification PCR a partir des cDNA 
correspondants, dont la sequence est connue [Nagata S. et aL, EMBO J. 5 (1986) 
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575-581]. Ces cDNA peuvent etre isoles par les techniques de l'homme de Tart, par 
exemple en utilisant le kit distribue par Amersham, a partir d'une lignee cellulaire 
humaine exprimant le G-CSF, et par exemple la lignee cellulaire CHU-2 de 
carcinome humain [Nagata et al. f Nature 213. (1986) 415-418]. 

5 II peut etre egalement souhaitable d'inserer un linker peptidique entre la 

partie SAH et G-CSF, par exemple pour permettre une meilleure presentation 
fonctionnelle de la partie transductrice. Un fragment de restriction Mstl l-Hindlll est 
par exemple gSnere par substitution du fragment Mst ll- Apa l de la Figure 1 par les 
oligodeoxynucleotides Sq2742 (5 ! -TTAGGCTTA GGTGGTGGCGGTA CCCCCC- 

10 TGGGCC-3 1 , les codons codant pour les residus glycine de ce linker particulier sont 
soulignes) et Sq2741 (S'-CAGGGGGGTACCGCCACCACCTAAGCC-S') qui 
forment en s'appariant un fragment Mst ll- Apa l. Le plasmide pYG1336 ainsi genere 
comporte done un fragment de restriction Mst n -HindU L dont la sequence est 
identique a celle de la Figure 1 a l'exception du fragment Mstll- Apal . 

15 EXEMPLE 2 : FUSIONS EN PHASE TRADUCTIONNELLE ENTRE LA 
SAH ET LE G-CSF HUMAIN 

E.2.1. Fusion traductionnelle du type SAH-G.CSF. 
Le plasmide pYG404 est decrit dans la demande de brevet EP 361 991 . Ce 
plasmide comporte un fragment de restriction Hind lll codant pour le gene de la 

20 prepro-SAH precede des 21 nucleotides naturellement presents immediatement en 
amont de TATG initiateur de traduction du g&ie PGK de S. cerevisiae . Pius 
particulierement, ce fragment comporte un fragment de restriction Hindlll-Mstll 
correspondant a la totalite du gene codant pour la prepro-SAH a Texception des trots 
acides amines les plus C-terminaux (residus leucine-glycine-leucine). La ligature de 

25 ce fragment avec le fragment MstD- Hind lll du plasmide pYG1255 permet de 
generer le fragment Hind lll du plasmide pYG1259 qui code pour une proteine 
chimere dans laquelle la forme B du G-CSF mature est positionnee par couplage 
genetique en phase traductionnelle en C-terminal de la molecule de SAH. La 
sequence nucleotidique de ce fragment de restriction est donnee a la Figure 1, ainsi 

30 que la sequence polypeptidique de la chimere correspondante (SAH-G.CSF, cf. ' 
Figure 2, panneau A). 

Un fragment de restriction HiMIII identique & Texception du fragment Mstl l- 
Apa l peut egalement etre facilement genere et qui code pour une proteine chimere 



WO 93/15211 



PCT/FR93/00086 



14 

dans laquelle la forme B du G-CSF mature est positionnee par couplage genetique 
en phase traductionnelle en C-terminal de la molecule de SAH et d'un linker 
peptidique particulier. Par exemple ce linker est constitue de 4 residus glycine dans 
le fragment Hindm du plasmide pYG1336 (chimere SAH-Gly4-G.CSF, cf. Figure 

5 2 t panneauA). 

E.2.2. Fusion traductionnelle du type G.CSF-SAH. 

Dans un mode realisation particulier, les techniques combinees de 
mutagenese dirigee et rfamplification PCR permettent de construire des genes 
hybrides codant pour une proteine chimere (Figure 2, panneau B) resultant du 

10 couplage traductionnel entre un peptide signal (et par exemple la region prepro de la 
SAH), une sequence incluant un gene ayant une activite G-CSF, et la forme mature 
de la SAH ou un de ses variants moleculaires. Ces genes hybrides sont 
pref erentiellement bordes en 5 1 de l 1 ATG initiateur de traduction et en 3' du codon de 
fin de traduction par des sites de restriction Hind m. Par exemple l'oligodeoxy- 

15 nucleotide Sq2369 (S-GTTCTACGCCACCTTGCGCAGCC CGGTGGAGGCGGT- 
GATGCACACAAGAGTGAGGTrGCTCATCGG-y, les residus soulignes 
(optionnels) correspondent dans cette chimere particuliere £ tin linker peptidique 
compose de 4 residus glycine) permet par mutagenese dirigee de mettre en phase 
traductionelle la forme mature du G-CSF humain du plasmide BBG13 

20 immediatement en amont de la forme mature de la SAH, ce qui genere le plasmide 
intermediaire A. De fagon similaire, Tutilisation de ToligodSoxynucleotide Sq2338 
r5' *CAGGGAGCTGGCAGGGCCCAGGGGGGTT CGACGAAACACACCCCTG- 
GAATAAGCCGAGCT-3' (brin non codant), les nucleotides complementaires aux 
nucleotides codant pour les premiers residus N-terminaux de la forme mature du G- 

25 CSF humain sont soulignes] permet par mutagenese dirigee de coupler en phase 
traductionnelle de lecture la region prepro de la SAH immediatement en amont de la 
forme mature du G-CSF humain, ce qui genere le plasmide intermediaire B. On 
genere ensuite le fragment Hindm de la Figure 5 en associant le fragment Hindl ll- 
Ssfl du plasmide B (jonction region prepro de la SAH + fragment N-tenninal du 

30 GCSF mature) avec le fragment Sstl -Hind m du plasmide A [jonction G-CSF 
mature- (glycine) X 4-S AH mature], Le plasmide pYG1301 contient ce fragment de 
restriction Hindm particulier codant pour la chimere G.CSF-Gly4-SAH fusionnee 
immediatement en aval de la region prepro de la SAH. 
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E.2.3. Fusion traductionnelle du type G.CSF-SAH-G.CSR 

Ces memes techniques de mutagenese dirigee et ^amplification de l'ADN in 

xilEQ permettent de construire des genes hybrides dans lesquelles une sequence 

codant pour une activite G-CSF est couplee aux extremites N- et C- terminales de la 
5 SAH ou un de ses variants moleculaires (Figure 2, panneau C). Ces genes hybrides 

sont preferentiellement bordes en 5' de l'ATG initiateur de traduction et en 3' du 

codon de fin de traduction par des sites de restriction Hind lll. 

EXEMPLE 3 : CONSTRUCTION DES PLASMIDES D'EXPRESSION 

Les proteines chimeres des exemples precedents peuvent etre exprimees dans 

10 les levures a partir de promoteurs fonctionnels, regulables ou constitutes, tels que, 
par exemple, ceux presents dans les plasmides pYG105 (promoteur LAC4 de 
KlVYYWTnyC^ lactis), pYG106 (promoteur PGK de Saccharomvees cerevisiaeh 
pYG536 (promoteur PHQ5 de S. cerevisiae) . ou des promoteur hybrides tels que 
ceux portes par les plasmides decrits dans la demande de brevet EP 361 991, 

15 Par exemple, le fragment de restriction Hind m du plasmide pYG1259 est 

clone dans Torientation productive dans le site de restriction Hindm du plasmide 
d'expression pYG105, ce qui genere le plasmide ^expression pYG1266 (Figure 3). 
Le plasmide pYG105 corresponds au plasmide pKan707 d6crit dans la demande de 
brevet EP 361 991 dans lequel le site de restriction Hindm a ete detruit par 

20 mutagenese dirigee (oligodeoxynucleotide Sql053: 5-GAAATGCATAAGCTC- 
T^GCCATTCTCACCG.3 , ) et dont le fragment Sall-SacI codant pour le gene 
IJEA3 a ete remplace par un fragment de restriction Sall -SacI comportant le 
promoteur LA£4 (sous la forme tfun fragment Sall- Hind m) et le terminateur du 
gene EQK de S, Cgrgyii^ige (sous la forme d'un fragment Hindm-SacI), Le plasmide 

25 pYG105 est mitotiquement tres stable en Tabsence de g&ieticine (G418) et permet 
d'exprimer la proteine chimere a partir du promoteur LAC4 de K. lactis. notamment 
quand la source carbonnee est du lactose. Dans une autre exemplification, le clonage 
dans Torientation productive du fragment de restriction Hind m du plasmide 
pYG1259 dans le siteHindin du plasmide pYG106 genere le plasmide d'expression 

30 pYG1267. Les plasmides pYG1266 et pYG1267 sont isogeniques entre eux a 
Texception du fragment de restriction Sall-iiindni codant pour le promoteur LAC4 
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de K. lactis (plasmide pYG1266) ou le promoteur PGK de S. cerevisiae (plasmide 
pYG1267). 

Dans une autre exemplification, le clonage dans l'orientation productive du 
fragment de restriction Hind UI du plasmide pYG1336 (chimere SAH-GIy4-G.CSF, 
5 cf. E.2.1.) dans le site Hindm des plasmides pYG105 et pYG106 genere les 
plasmides ^expression pYG1351 et pYG1352, respectivement. 

De meme, le clonage dans l'orientation productive du fragment de restriction 
Hindm du plasmide pYG1301 (chimere G.CSF-Gly4-SAH, cf. E.2.2.) dans le site 
Hindm des plasmides pYG105 et pYG106 genere les plasmides d'expression 
10 pYG1302 et pYG1303, respectivement 

EXEMPLE 4 : TRANSFORMATION DES LEVURES 

La transformation des levures appartenant au genre Kluyveromvces. et en 
particulier les souches MW98-8C et CBS 293.91 de K. lactis. s'effectue par exemple 
par la technique de traitement des cellules entieres par de Tacetate de lithium (Ito H. 
15 et aL t J. BacterioL 152 (1983) 163-168), adaptee comme suit La croissance des 
cellules se fait a 28°C dans 50 ml de milieu YPD, avec agitation et jusqu'a une 
densite optique a 600 nm (POsqo) comprise entre 0,6 et 0,8 ; les cellules sont 

recoltees par centrifugation a faible vitesse, lavees dans une solution sterile de TE 
(10 mM Tris HC1 pH 7,4 ; 1 mM EDTA), resuspendues dans 3-4 ml d'acetate 
20 lithium (0,1 M dans du TE) pour obtenir une densite cellulaire d'environ 2 x 10 8 
cellules/ml, puis incubees a 30°C pendant 1 heure sous agitation moderee. Des 
aliquotes de 0,1 ml de la suspension resultante de cellules competentes sont incubes 
a 30°C pendant 1 heure en presence d f ADN tt a une concentration finale de 35 % de 
polyethylene glycol (PEG400O' Sigma)/ Apres un choc thermique de 5 minutes a 

25 42°C, les cellules sont lavees 2 fois, resuspendues dans 0,2 ml d'eau stferile et 
incubees 16 heures a 28°C dans 2 ml de milieu YPD pour permettre Texpression 
phenotypique de la fusion ORF1-APH exprimee sous controle du promoteur P^l ; 

200 \ji de la suspension cellulaire sont ensuite etales sur boites YPD selectives 
(G418, 200 \xgfml). Les boites sont mises a incuber a 28°C et les transformants 
30 apparaissent apres 2 a 3 jours de croissance cellulaire* 
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EXEMPLE 5 : SECRETION DES CHIMERES 

Apres selection sur milieu riche supplements en G418 les clones 
recombinants sont testes pour leur capacite a secreter la forme mature des proteines 
chimeres entre SAH et G-CSF. Quelques clones correspondant a la souche K. lactis 
5 CBS 293.91 transformee par les plasmides pYG1266 ou pYG1267 (SAH-G.CSF), 
pYG1302 ou pYG1303 (G.CSF-Gly4-SAH) ou encore pYG1351 ou pYG1352 
(SAH-Gly4-G.CSF) sont mis a incuber en milieu liquide complet selectif a 28°C. 
Les surnageants cellulaires sont alors testes apres electrophorese en gel d'acrylamide 
a 8.5%,- soit directement par coloration du gel d'acrylamide par du bleu de 

10 coomassie (Figure 4, panneau A) f soit apres immunoblot en utilisant comme 
anticorps primaires des anticorps polyclonaux de lapin specifiquement diriges contre 
le G-CSF humain, ou contre la SAH. Lors des experiences de detection 
immunologique, le filtre de nitrocellulose est d'abord incube en presence de 
l'anticorps specifique. lave plusieurs fois, incube en presence d'anticorps de chevre 

15 anti-lapin biotinyles, puis incube en presence d'un complexe avidine-peroxydase en 
utilisant le "kit ABC" distribue par Vectastain (Biosys S.A., Compiegne, France). La 
reaction immunologique est ensuite r£velee par addition de diamino-3,3 1 benzidine 
tetrachlorydrate (Prolabo) en presence d'eau oxygenee, selon les recommandations 
du fournisseur. Les resultats de la Figure 4 demontrent que la proteine hybride SAH- 

20 G.CSF est reconnue a la fois par des anticorps diriges contre l ! albumine humaine 
(panneau C) et le G-CSF humain (panneau B). Les resultats de la Figure 6 indiquent 
que la chimere SAH-Gly4-G.CSF (piste 3) est particulierement bien secretee par la 

levure Kluyy^roniycgS. possiblement du fait que la presence du linker peptidique 
entre partie SAH et partie G-CSF est plus favorable a un repliement indfependant de 
25 ces 2 parties lors du transit de la chimere dans la voie secretoire, De plus la fusion N- 
terminale (G.CSF-Gly4-SAH) est egalement secretee par la levure Kluyveromyces 
(Figure 6, piste 1). 

EXEMPLE 6 : PURIFICATION ET CARACTERISATION MOLECULAIRE 
DES PRODUITS SECRETES 

30 Apres centrifugation d'une culture de la souche CBS 293.91 transformee par . 

les plasmides d'expression selon Texemple 3, le surnageant de culture est passe a 
travers un filtre de 0,22 mm (Millipore), puis concentre par ultrafiltration (Amicon) 
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en utilisant une membrane dont le seuil de discrimination se situe a 30 kDa. Le 
concentrat obtenu est alors ajuste a 50 mM Tris HC1 a partir dune solution stock de 
Tris HC1 1M (pH 6), puis depose par fractions de 20 ml sur une colonne (5 ml) 
echangeuse d'ions (Q Fast Flow, Pharmacia) equilibree dans le meme tampon. La 

5 proteine chimere est alors eluee de la colonne par un gradient (0 a 1 M) de NaCL Les 
fractions contenant la proteine chimere sont alors reunies et dialysees contre une 
solution de Tris HC1 50 mM (pH 6) et redeposees sur colonne Q Fast Flow (1 ml) 
equilibree dans le meme tampon. Apres elution de la colonne, les fractions contenant 
la proteine sont reunies, dialysees contre de 1'eau et lyophilisees avant caracte- 

10 risation; par exemple, le sequen§age (Applied Biosystem) de la proteine SAH-G.CSF 
secretee par la levure CBS 293.91 donne la sequence N-terminale attendue de la 
SAH (Asp-Ala-His...), demontrant une maturation correcte de la chimere immedia- 
tement en C-terminal du doublet de residus Arg-Arg de la region "pro" de la SAH 
(Figure 1). 

15 EXEMPLE 7 : ACTIVITE BIOLOGIQUE DES CHIMERES ENTRE SAH ET 
G-CSF 

E.7.L ActivitebiologiqueiDjitm. 

Les chimeres purifiees selon Texemple 6 sont testees pour leur capacite a 
permettre la proliferation in vitro de la lignee murine IL3-dependante NFS60, par 
mesure de Incorporation de thymidine tritiee essentiellement selon le protocole 
decrit par Tsuchiya et al. [Proc. NatL Acad. Sci. (1986) £2 7633]. Pour chaque 
chimere, les mesures sont realisees entre 3 et 6 fois dans un test trois points (trois 
dilutions du produit) dans une zone ou la relation entre quantite de produit actif et 
incorporation de thymidine marquee (Amersham) est lineaire. Dans chaque plaque 
de microtitration, Tactivite dun produit reference constitue de G-CSF humain 
recombinant exprime dans des cellules mammiferes est egalement systematiquement 
incorpore. Les resultats de la Figure 7 demontrent que la chimere SAH-G.CSF 
(pYG1266) secretee par la levure Kluweromvces est capable in vitro de transduire 
un signal de proliferation cellulaire pour la lignee NFS60. Dans ce cas particulier, 
Tactivite specifique (cpm/molarite) de la chimere est environ 7 fois plus f aible que 
celle du G-CSF reference (non couple). 



25 
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E.7.2. Activite iijjjvQ 

L'activite de stimulation des chimeres SAH/G-CSF sur la granulopoiese in 
vivo est testee aprSs injection sous-cutanee chez le rat (Sprague-Dawley/CD, 250- 
300 g, 8-9 semaines) et comparee a celle du G-CSF reference exprime a partir de 

5 cellules de mammifere. Chaque produit, testh a raison de 7 animaux, est injecte par 
voie sous-cutanee en region dorso-scapulaire a raison de 100 ml pendant 7 jours 
consecutifs (J1-J7). 500 ml de sang sont recueillis aux jours J-6, J2 (avant la 2® me 
injection), J5 (avant la 5® me injection) et J8, et une numeration sanguine est 
effectuee. Dans ce test, l'activite specifique (unites de neutropoiese/mole injeaee) de 

10 la chimere SAH-G.CSF (pYG1266) est identique a celle du G-CSF reference 
(Figure 8). Puisque cette chimere particuliere possede in vitro une activite specifique 
7 fois plus faible que celle du G-CSF reference (Figure 7), il est done demontre que 
le couplage genetique du G-CSF sur la SAH en modifie favorablement les proprietes 
pharmacocinetiques. 
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REVINDICATIONS 

1. Polypeptide recombinant comportant une partie active constituee par tout 
ou partie du G-CSF ou d'un variant du G-CSF couple a une structure stabilisatrice 
essentiellement proteique. 

2. Polypeptide selon la revendication 1 caracterise en ce que la partie active 
presente une structure choisie parmi : 

(a) la sequence peptidique comprise entre les residus Thr586-Pro759 de la 
sequence donnee sur la Figure 1, 

(b) une partie de la structure peptidique (a) ayant conserve l'activite 
biologique du G-CSF, et, 

(c) une structure derivee des structures (a) ou (b) par modifications 
structurales (mutation, substitution, addition et/ou deletion d'un ou plusieurs 
residus), et ayant conserve l'activite biologique du G-CSF, ou une activite modifiee. 

3. Polypeptide selon la revendication 1 ou 2 caracterise en ce que la partie 
15 active est couplee a Textremite N-terminale de la structure stabilisatrice. 

4. Polypeptide selon la revendication 1, 2 ou 3 caracterise en ce que la 
partie active est couplee a Textremite C-terminale de la structure stabilisatrice. 

5. Polypeptide selon Tune des revendications 1 a 4 caracterise en ce que la 
structure stabilisatrice est un polypeptide possedant une demie-vie plasmatique 

20 elevee. 

6. Polypeptide selon la revendication 5 caracterise en ce que le polypeptide 
possedant une demie-vie plasmatique elevee est une proteine telle qu'une albumine, 
une apolipoproteine, une immunoglobuline ou encore une transf erine. 

7. Polypeptide selon la revendication 5 caracterise en ce que le polypeptide 
25 possedant une demie-vie plasmatique elevee est derive par modification(s) 

structurale(s) (mutation, substitution, addition et/ou d61etion d'un ou plusieurs 
residus, modification chimique) d'une proteine selon la revendication 6. 
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8. Polypeptide selon l'une des revendications 5 a 7 caracterise en ce que la 
structure stabilisatrice est un polypeptide faiblement ou non-immunogenique pour 
l'organisme dans lequel il est utilise. 

9. Polypeptide selon la revendication 5 caracterise en ce que la structure 
5 stabilisatrice est une album ine ou un variant de l'albumine. 

10. Sequence nucleotidique codant pour un polypeptide selon l'une 
quelconque des revendications 1 a 9. 

11. Sequence nucleotidique selon la revendication 10 caracterisee en ce 
qu'elle comprend une sequence "leader" permettant la secretion du polypeptide - 

10 exprinie. 

12. Cassette d'expression comprenant tine sequence nucleotidique selon 
Tune des revendications 10 ou 11 sous le controle d'une region d'initiation de la 
transcription et eventuellement d'une region de terminaison de la transcription. 

13. Plasmide autoreplicatif comportant une cassette d'expression selon la 
15 revendication 12. 

14. Cellule recombinante eucaryote ou procaryote dans laquelle a ete insere 
une sequence nucleotidique selon Tune des revendications 10 ou 11 ou une cassette 
d'expression selon la revendication 12 ou un plasmide selon la revendication 13. 

15. Cellule recombinante selon la revendication 14 caracterisee en ce qu'il 
20 s'agit d'une levure, d'une cellule animate, dHin champignon ou d'une bact&ie. 

16. Cellule recombinante selon la revendication 15 caracterisee en ce qu'il 
s'agit d'une levure. 

17. Cellule recombinante selon la revendication 16 caracterisee en ce qu'il 
s'agit d'une levure du genre Saccharomyces ou Kluweromvces . 

25 18. Procede de preparation d'un polypeptide tel que defini dans Time des 

revendications 1 a 9 caracterise en ce que Ton cultive une cellule recombinante selon 
l'une des revendications 14 a 17 dans des conditions d'expression, et on recupere le 
polypeptide produit. 
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19. Composition pharmaceutique comprenant un ou plusieurs polypeptides 
selon l'une quelconque des revendications 1 a 9. 

20. Composition pharmaceutique selon la revendication 19 destinee a etre 
utilisee dans toutes les situations pathologiques dans lesquelles le nombre et/ou 

5 l'activite des granulocytes doivent etre stimulees, 

21. Composition pharmaceutique selon la revendication 20 destinee a la 
prevention ou au traitement des leukopenies ou de certaines leucemies. 

22. Composition pharmaceutique selon la revendication 20 utilisable dans le 
cas de greffes ou de traitement anticancereux, pour restaurer le systeme immunitaire. 

10 
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SEP. fP NO: 1 



TYPE DE SEQUENCE: 
LONGUEUR : 
NOMBRE DE BRINS : 
CONFIGURATION : 
TYPEDE MOLECULE: 

ORICINE : 



Nucleotide et sa proteine correspondante 

2382 nucleotides 

1 

Lineaire 

Fragment de restriction Hindll! du plasmide d'expression pYG1259 
(chimere C.CSF-SAH) 
Recombinaisons gen^tiques in vitro 



AAGCT TTACAACAAA TATAAAAACA 



AGC 
Ser 


TCG 
Ser 


GCT 
Ala 


TAT 
Tyr 


TCC 
Ser 


AGG 
Arg 


GGT 
Gly 


CGG 
Arg 


TTT 
Phe 


AAA 
Lys 


GAT 
Asp 


TTG 
Leu 


GGA 
Gly 


GAA 
Glu 


TAT 
Tyr 


CTT 
Leu 


CAG 
Gin 


CAG 
Gin 


TGT 
Cys 


CCA 
Pro 


TTT 
Phe 


QCA 

Ala 


AAA 
Lys 


ACA 
Thr 


TGT 
Cys 


GTT 
Val 


GCT 
Ala 


GAT 
Asp 


TTT 
Phe 


GGA 
Gly 


GAC 
Asp 


AAA 
Lys 


TTA 
Leu 


TGC 
Cys 


ACA 
Thr 


TGC 
Cys 


TGT 
Cys 


GCA 
Ala 


AAA 
Lys 


CAA 
Gin 


GAA 
Glu 


CCT 
Pro 


CCA 
Pro 


AAC 
Asn 


CTC 
Leu 


CCC 
Pro 


CGA 
Arg 


TTG 
Leu 


GTG 
Val 


AAT 
Asn 


GAA 
Glu 


GAG 
Glu 


ACA 
Thr 


TTT 
Phe 


TTG 
Leu 


AAA 
Lys 


TAT 
Tyr 


GCC 
Ala 


CCG 
Pro 


GAA 
Glu 


CTC 
Leu 


CTT 
Leu 


TTC 
Phe 


CAA 
Gin 


GCT 
Ala 


GCT 
Ala 


GAT 
Asp 


AAA 
Lys 


GCT 
Ala 


GCC 
Ala 


AAG 
Lys 


GCT 
Ala 


TCG 
Ser 


TCT 
Ser 


GCC 
Ala 


AAA 
Lys 


CAG 
Gin 


GCT 
Ala 


TTC 
Phe 


AAA 
Lys 


GCA 
Ala 


TGG 
Trp 


GCA 
Ala 


GTA 
Val 


GAA 
Glu 


GTT 
Val 


TCC 
Ser 


AAG 
Lys 


TTA 
Leu 


GTG 
Val 


ACA 
Thr 


CTG 
Leu 


CTT 
Leu 


GAA 
Glu 


TGT 
Cys 


GCT 
Ala 


GAT 
Asp 


GAC 
Asp 


TCG 
Ser 


ATC 
He 


TCC 
Ser 


AGT 
Ser 


AAA 
Lys 


CTG 
Leu 


AAG 
Lys 


ATT 
He 


GCC 
Ala 


GAA 
Glu 


GTG 
Val 


GAA 
Glu 


AAT 
Asn 


GAT 
Asp 


GTT 
Val 


GAA 
Glu 


AGT 
Ser 


AAG 
Lys 


GAT 
Asp 


GTT 
Val 


TGC 
Cys 


TTT 
Phe 


TTG 
Leu 


TAT 
Tyr 


,GAA 
Glu 


TAT 
Tyr 


GCA 
Ala 


AGA 
Arg 



ATG AAG TGG GTA ACC TTT ATT TCC CTT CTT TTT CTC TTT 

Met Lys Trp Val Thr Phe He Ser Leu Leu Phe Leu Phe < -12 

GTG TTT CGT CGA GAT GCA CAC AAG AGT GAG GTT GCT CAT 

Val Phe Arg Arg Asp Ala His Lys Ser Glu Val Ala His 9 

GAA AAT TTC AAA GCC TTG GTG TTG ATT GCC TTT GCT CAG 

Glu Asn Phe Lys Ala Leu Val Leu He Ala Phe Ala Gin 29 

GAA GAT CAT GTA AAA TTA GTG AAT GAA GTA ACT GAA TTT 

Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu Phe 49 

GAG TCA GCT GAA AAT TGT GAC AAA TCA CTT CAT ACC CTT 

Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu 69 

GTT GCA ACT CTT CCT GAA ACC TAT GGT GAA ATG GCT GAC 

Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp 89 

GAG AGA AAT GAA TGC TTC TTG CAA CAC AAA GAT GAC AAC 

Glu Arg Asn Glu Cys Phe Leu Gin His Lys Asp Asp Asn 109 

AGA CCA GAG GTT GAT GTG ATG TGC ACT GCT TTT CAT GAC 

Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His Asp 129 

AAA TAC TTA TAT GAA ATT GCC AGA AGA CAT CCT TAG TTT 

Lys Tyr Leu Tyr Glu He Ala Arg Arg His Pro Tyr Phe 149 

TTT GCT AAA AGG TAT AAA GCT GCT TTT ACA GAA TGT TGC 

Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys 169 

TGC CTG TTG CCA AAG CTC GAT GAA CTT CGG GAT GAA GGG 

Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly 189 

AGA CTC AAG TGT GCC AGT CTC CAA AAA TTT GGA GAA AGA 

Arg Leu Lys Cys Ala Ser Leu Gin Lys Phe Gly Glu Arg 209 

GCT CGC CTG AGC CAG AGA TTT CCC AAA GCT GAG TTT GCA 

Ala* Arg Leu Ser Gin Arg Phe Pro Lys Ala Glu Phe Ala 229 

GAT CTT ACC AAA GTC CAC ACG GAA TGC TGC CAT GGA GAT 

Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp 249 

AGG GCG GAC CTT GCC AAG TAT ATC TGT GAA AAT CAA GAT 

Arg Ala Asp Leu Ala Lys Tyr He Cys Glu Asn Gin Asp 269 

GAA TGC TGT GAA AAA CCT CTG TTG GAA AAA TCC CAC TGC 

Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His Cys 23? 

GAG ATG CCT GCT GAC TTG CCT TCA TTA GCT GCT GAT TTT 

Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe 309 

AAA AAC TAT GCT GAG GCA AAG GAT GTC TTC CTG GGC ATG 

Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met 329 

AGG CAT CCT GAT TAC TCT GTC GTA CTG CTG CTG AGA CTT 

Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu 349 



Figure 1(a) 
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GCC AAG ACA TAT GAA ACC ACT CTA GAG AAG TGC TGT GCC GCT GCA GAT CCT CAT GAA TGC 

Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu Cys 369 

TAT GCC AAA GTG TTC GAT GAA TTT AAA CCT CTT GTG GAA GAG CCT CAG AAT TTA ATC AAA 

Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gin Asn Leu He Lys 389 

CAA AAT TGT GAG CTT TTT GAG CAG CTT GGA GAG TAC AAA TTC CAG AAT GCG CTA TTA GTT 

Gin Asn Cys Glu Leu Phe Glu Gin Leu Gly Glu Tyr Lys Phe Gin Asn Ala Leu Leu Val 409 

CGT TAC ACC AAG AAA GTA CCC CAA GTG TCA ACT CCA ACT CTT GTA GAG GTC TCA AGA AAC 

Arg Tyr Thr Lys Lys Val Pro Gin Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn 429 

CTA GGA AAA GTG GGC AGC AAA TGT TGT AAA CAT CCT GAA GCA AAA AGA ATG CCC TGT GCA 

Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Ala 449 

GAA GAC TAT CTA TCC GTG GTC CTG AAC CAG TTA TGT GTG TTG CAT GAG AAA ACG CCA GTA 

Glu Asp Tyr Leu Ser Val Val Leu Asn Gin Leu Cys Val Leu His Glu Lys Thr Pro Val 469 

AGT GAC AGA GTC ACC AAA TGC TGC ACA GAA TCC TTG GTG AAC AGG CGA CCA TGC TTT TCA 

Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser 489 

GCT CTG GAA GTC GAT GAA ACA TAC GTT CCC AAA GAG TTT AAT GCT GAA ACA TTC ACC TTC 

Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe 509 

CAT GCA GAT ATA TGC ACA CTT TCT GAG AAG GAG AGA CAA ATC AAG AAA CAA ACT GCA CTT 

His Ala Asp He Cys Thr Leu Ser Glu Lys Glu Arg Gin He Lys Lys Gin Thr Ala Leu 529 

GTT GAG CTT GTG AAA CAC AAG CCC AAG GCA ACA AAA GAG CAA CTG AAA GCT GTT ATG GAT 

Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gin Leu Lys Ala Val Met Asp 549 

GAT TTC GCA GCT TTT GTA GAG AAG TGC TGC AAG GCT GAC GAT AAG GAG ACC TGC TTT GCC 

Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala 569 

GAG GAG GGT AAA AAA CTT GTT GCT GCA AGT CAA GCT GCC TTA GGC TTA ACC CCC C TG GGC 

Glu Glu Gly Lys Lys . Leu Val Ala Ala Ser Gin Ala Ala Leu Gly Leu Thr Pro Leu Gly 589 

££T GCC AGC TCC CTG CCC CAG AGC TTC CTG CTC AAG TGC TTA GAG CAA GTG AGG AAG ATC 

Pro Ala Ser Ser Leu Pro Gin Ser Phe Leu Leu Lys Cys Leu Glu Gin Val Arg Lys lie 609 

CAG GGC GAT GGC GCA GCG CTC CAG GAG AAG CTG TGT GCC ACC TAC AAG CTG TGC CAC CCC 

Gin Gly Asp Gly Ala Ala Leu Gin Glu Lys Leu Cys Ala Thr Tyr Lys Leu Cys His Pro 629 

GAG GAG CTG GTG CTG CTC GGA CAC TCT CTG GGC ATC CCC TGG GCT CCC C TG AGC TCC TGC 

Glu Glu Leu Val Leu Leu Gly His Ser Leu Gly lie Pro Trp Ala Pro Leu Ser Ser Cys 649 

CCC AGC CAG GCC CTG CAG CTG GCA GGC TGC TTG AGC CAA CTC CAT AGC GGC CTT TTC CTC 

Pro Ser Gin Ala Leu Gin Leu Ala Gly Cys Leu Ser Gin Leu His Ser Gly Leu Phe Leu 669 

TAC CAG GGG CTC CTG CAG GCC CTG GAA GGG ATA TCC CCC GAG TTG GGT CCC ACC TTG GAC 

Tyr Gin Gly Leu Leu Gin Ala Leu Glu Gly lie Ser Pro Glu Leu Gly Pro Thr Leu Asp 689 

ACA CTG CAG CTG GAC GTC GCC GAC TTT GCC ACC ACC ATC TGG CAG CAG ATG GAA GAA CTG 

Thr Leu Gin Leu Asp Val Ala Asp Phe Ala Thr Thr lie Trp Gin Gin Met Glu Glu Leu 709 

GGA ATG GCC CCT GCC CTG CAG CCC ACC CAG GGT GCC ATG CCG GCC TTC GCC TCT GCT TTC 

Gly Met Ala Pro Ala Leu Gin Pro Thr Gin Gly Ala Met Pro Ala Phe Ala Ser Ala Phe 729 

CAG CGC CGG GCA GGA GGG GTC CTG GTT GCT AGC CAT CTG CAG AGC TTC CTG GAG GTG TCG 

Gin Arg Arg Ala Gly Gly Val Leu Val Ala Ser His Leu Gin Ser Phe Leu Glu Val Ser IAS 

TAC CGC GTT CTA CGC CAC CTT GCG CAG CCC TGA AGCTT 

Tyr Arg Val Leu Arg His Leu Ala Gin Pro *** 759 



Figure Kb) 
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WO 93/15211 



6/10 



PCT/FR93/00086 



SEP. ID NO : 



TYPE DE SEQUENCE: 
LONGUEUR : 
NOMBRE DE BRINS : 
CONFIGURATION : 
TYPE DE MOLECULE : 



ORIGINE : 



Nucleotide et sa proline correspondante 

2455 nucleotides 

1 

Lineaire 

Fragment de restriction HindHI du plasmide d' expression pYG130l 
(chimere G.CSF-Gly4-SAH position* ee immecbatement en aval de 
la region prepro de la SAH) 
Recombinaisons genltiques in vitro 



AAGCT TTACAACAAA TATAAAAACA ATG AAG TGG GTA ACC TTT ATT TCC CTT CTT TTT CTC TIT 

Met Lys Trp Val Thr Phe He Ser Leu Leu Phe Leu Phe -12 

ApaX 

AGO TCG QCT TAT TCC AGG GGT GTG TTT CGT CGA ACC CCC C TG GGC CCT GCC AGC TCC CTG 
Ser Ser Ala Tyr Ser Arg Gly Val Phe Arg Arg Thr Pro Leu Gly Pro Ala Ser Ser Leu 9 

I >G-CSF 

CCC CAG AGC TTC CTG CTC AAG TGC TTA GAG CAA GTG AGG AAG ATC CAG GGC GAT GGC GCA 

Pro Gin Ser Phe Leu Leu Lys Cys Leu Glu Gin Val Arg Lys He Gin Gly Asp Gly Ala 29 

GCG CTC CAG GAG AAG CTG TGT GCC ACC TAC AAG CTG TGC CAC CCC GAG GAG CTG GTG CTG 
Ala Leu Gin Glu Lys Leu Cys Ala Thr Tyr Lys Leu cys His Pro Glu Glu Leu Val Leu " 49 

SatI 

CTC GGA CAC TCT CTG GGC ATC CCC TGG GCT CCC C TG AGC TCC TGC CCC AGC CAG GCC CTG 

Leu Gly His Ser Leu Gly He Pro Trp Ala Pro Leu Ser Ser Cys Pro Ser Gin Ala Leu 69 

CAG CTG GCA GGC TGC TTG AGC CAA CTC CAT AGC GGC CTT TTC CTC TAC CAG GGG CTC CTG 

Gin Leu Ala Gly Cys Leu Ser Gin Leu His Ser Gly Leu Phe Leu Tyr Gin Gly Leu Leu 89 

CAG GCC CTG GAA GGG ATA TCC CCC GAG TTG GGT CCC ACC TTG GAC ACA CTG CAG CTG GAC 

Gin Ala Leu Glu Gly He Ser Pro Glu Leu Gly Pro Thr Leu Asp Thr Leu Gin Leu Asp 109 

GTC GCC GAC TTT GCC ACC ACC ATC TGG CAG CAG ATG GAA GAA CTG GGA ATG GCC CCT GCC 

Val Ala Asp Phe Ala Thr Thr He Trp Gin Gin Met Glu Glu Leu Gly Met Ala Pro Ala 129 

CTG CAG CCC ACC CAG GGT GCC ATG CCG GCC TTC GCC TCT GCT TTC CAG CGC CGG GCA GGA 

Leu Gin Pro Thr Gin Gly Ala Met Pro Ala Phe Ala Ser Ala Phe Gin Arg Arg Ala Gly 149 

GGG GTC CTG GTT GCT AGC CAT CTG CAG AGC TTC CTG GAG GTG TCG TAC CGC GTT CTA CGC 

Gly Val Leu Val Ala Ser His Leu Gin Ser Phe Leu Glu Val Ser Tyr Arg Val Leu Arg 169 

CAC CTT GCG CAG CCC GGT GGA CCC CX7T GAT GCA CAC AAG ACT GAG GTT GCT CAT CGG TTT 
His Leu Ala Gin Pro Glv Glv Glv Glv Asp Ala His Lys Ser Glu Val Ala His Arg Phe 189 
G-CSF< 1 linker I >SAH 

AAA GAT TTG GGA GAA GAA AAT TTC AAA GCC TTG GTG TTG ATT GCC TTT GCT CAG TAT CTT 

Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu He Ala Phe Ala Gin Tyr Leu 209 

CAG CAG TGT CCA TTT GAA GAT CAT GTA AAA TTA CTG AAT GAA GTA ACT GAA TTT GCA AAA 

Gin Gin Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys 229 

ACA TGT GTT GCT GAT GAG TCA GCT GAA AAT TGT GAC AAA TCA CTT CAT ACC CTT TIT GGA 

Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly 249 

GAC AAA TTA TGC ACA GTT GCA ACT CTT CGT GAA ACC TAT GGT GAA ATG GCT GAC TGC TGT 

Asp Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys 269 

GCA AAA CAA GAA CCT GAG AGA AAT GAA TGC TTC TTG CAA CAC AAA GAT GAC AAC CCA AAC 

Ala Lys Gin Glu Pro Glu Arg Asn Glu Cys Phe Leu Gin His Lys Asp Asp Asn Pro Asn 289 

CTC CCC CGA TTG GTG AGA CCA GAG GTT GAT GTG ATG TGC ACT GCT TTT CAT GAC AAT GAA 

Leu Pro Arg. Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His Asp Asn Glu 309 

GAG ACA TTT TTG AAA AAA TAC TTA TAT GAA ATT GCC AGA AGA CAT .OCT TAC TTT TAT GCC 

Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu He Ala Arg Arg His Pro Tyr Phe Tyr Ala 329 



Figure 5(a) 
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CCG GAA CTC CTT TTC TTT GCT AAA AGG TAT AAA GCT GCT TTT ACA GAA TGT TGC CAA GCT 

Pro Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gin Ala 349 

GCT GAT AAA GCT GCC TGC CTG TTG CCA AAG CTC GAT GAA CTT CGG GAT GAA QGG AAG GCT 

Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala 369 

TCG TCT GCC AAA CAG AGA CTC AAG TGT GCC AGT CTC CAA AAA TTT GGA GAA AGA GCT TTC 

Ser Ser Ala Lys Gin Arg Leu Lys Cys Ala Ser Leu Gin Lys Phe Gly Glu Arg Ala Phe 389 

AAA GCA TGG GCA GTA GCT CGC CTG AGC CAG AGA TTT CCC AAA GCT GAG TTT GCA GAA GTT 

Lys Ala Trp Ala Val Ala Arg Leu Ser Gin Arg Phe Pro Lys Ala Glu Phe Ala Glu Val 409 

TCC AAG TTA GTG ACA GAT CTT ACC AAA GTC CAC ACG GAA TGC TGC CAT GGA GAT CTG CTT 

Ser Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu 429 

GAA TGT GCT GAT GAC AGG GCG GAC CTT GCC AAG TAT ATC TGT GAA AAT CAA GAT TCG ATC 

Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr lie Cys Glu Asn Gin Asp Ser He 449 

TCC AGT AAA CTG AAG GAA TGC TGT GAA AAA CCT CTG TTG GAA AAA TCC CAC TGC ATT GCC 

Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His Cys He Ala 469 

GAA GTG GAA AAT GAT GAG ATG CCT GCT GAC TTG CCT TCA TTA GCT GCT GAT TTT GTT GAA 

Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu 489 

AGT AAG GAT GTT TGC AAA AAC TAT GCT GAG GCA AAG GAT GTC TTC CTG GGC ATG TTT TTG 

Ser Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu 509 

TAT GAA TAT GCA AGA AGG CAT CCT GAT TAC TCT GTC GTA CTG CTG CTG AGA CTT GCC AAG 

Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys 529 

ACA TAT GAA ACC ACT CTA GAG AAG TGC TCT GCC GCT GCA GAT CCT CAT GAA TGC TAT GCC 

Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala 549 

AAA GTG TTC GAT GAA TTT AAA CCT CTT GTG GAA GAG CCT CAG AAT TTA ATC AAA CAA AAT 

Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gin Asn Leu He Lys Gin Asn 569 

TGT GAG CTT TTT GAG CAG CTT GGA GAG TAC AAA TTC CAG AAT GCG CTA TTA GTT CCT TAC 

Cys Glu Leu Phe Glu Gin Leu Gly Glu Tyr Lys Phe Gin Asn Ala Leu Leu Val Arg Tyr 589 

ACC AAG AAA GTA CCC CAA GTG TCA ACT CCA ACT CTT CTA GAG CTC TCA AGA AAC CTA GGA 

Thr Lys Lys Val Pro Gin Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly 609 

AAA CTG GGC AGC AAA TCT TCT AAA CAT CCT GAA GCA AAA AGA ATG CCC TGT GCA GAA GAC 

Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro cys Ala Glu Asp 629 

TAT CTA TCC GTG GTC CTG AAC CAG TTA TCT GTG TTG CAT GAG AAA ACG CCA GTA ACT GAC 

Tyr Leu Ser Val Val Leu Asn Gin Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp 649 

AGA CTC ACC AAA TGC TGC ACA GAA TCC TTG GTG AAC AGG CGA CCA TGC TTT TCA GCT CTG 

Arg Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu 669 

GAA GTC GAT GAA ACA TAC GTT CCC AAA GAG TTT AAT GCT GAA ACA TTC ACC TTC CAT GCA 

Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala 689 

GAT ATA TGC ACA CTT TCT GAG AAG GAG AGA CAA ATC AAG AAA CAA ACT GCA CTT CTT GAG 

Asp He Cys Thr Leu Ser Glu Lys Glu Arg Gin He Lys Lys Gin Thr Ala Leu Val Glu 709 

CTT CTG AAA CAC AAG CCC AAG GCA ACA AAA GAG CAA CTG AAA GCT GTT ATG GAT GAT TTC 

Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gin Leu Lys Ala Val Met Asp Asp Phe 729 

GCA GCT TTT GTA GAG AAG TGC TGC AAG GCT GAC GAT AAG GAG ACC TGC TTT GCC GAG GAG 
Ala Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu 749 

Mstll 

GGT AAA AAA CTT GTT GCT GCA AGT CAA GCT GCC TTA CCC TTA TAA CATCACATTT 

Gly Lys Lys Leu Val Ala Ala Ser Gin Ala Ala Leu Gly Leu *** 763 

AAAAGCATCT CAGCCTACCA TGAGAATAAG AGAAAGAAAA TGAAGATCAA AAGCTT 



Figure 5(b) 
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